Day 05 當前 AI Agent 設計框架介紹

17th鐵人賽

chocolee

2025-09-19 19:12:23

286 瀏覽

分享至

AI Agent 設計框架介紹

以下整理當前比較流行／被討論度高的 AI Agent 框架，LangGraph 為重點，並與其他框架做比較。最後有設計框架時的原則／關鍵考量。

一、什麼是 AI Agent 框架

AI Agent 框架是一組工具與抽象（toolkits & abstractions），幫助開發者／團隊構建自主或半自主 agent：

能夠「思考 → 決策 → 執行工具呼叫／API 呼叫」
支援記憶 (memory)、狀態保存 (state persistence)、錯誤與異常處理
支援多步驟流程 (workflow/orchestration)、條件分支（branching）、人機協作（human-in-the-loop）等

二、LangGraph 是什麼

LangGraph 是由 LangChain 團隊推出／維護的開源架構，用來實作有狀態的、多步流程的 agent，特別是以 graph (圖／DAG) 為流程模型。
它的設計目標與特色如下：

特性	說明
Graph-based Orchestration	流程被建模為節點（nodes）與邊（edges），節點可以是 LLM 推理、工具呼叫、條件判斷、subgraph 等。這樣能做非線性流程、分支、重試、fallback 等。 :contentReference[oaicite:0]{index=0}
Stateful Execution / Memory	支援跨步驟與跨 session 的狀態保存和記憶體管理。能暫停 / 恢復流程。 :contentReference[oaicite:1]{index=1}
工具整合 (Tools / Function Calling)	節點可以呼叫外部 API 或函式，作為 agent 的工具／能力。 :contentReference[oaicite:2]{index=2}
觀察與除錯 (Observability & Debugging)	有 trace/logging 功能，可以追蹤 agent 在 graph 中每個節點的決策、輸入／輸出等。 :contentReference[oaicite:3]{index=3}
兼容性與彈性	可搭配多種 LLM 提供者 (OpenAI, local model, etc.)；也有同步／非同步支援，對特殊流程或效能有調整空間。 :contentReference[oaicite:4]{index=4}

三、市面上其他比較常見的框架比較

下面是一些框架以及它們的強項與適合情境，和 LangGraph 的差異。

框架名稱	強項／特色	適合情境	和 LangGraph 的差別 / 優劣比較
OpenAI Agents SDK	較輕量、與 OpenAI 的工具／API 整合良好，開發速度快。 :contentReference[oaicite:5]{index=5}	想要快速做 agent 原型、或已重度使用 OpenAI 的服務者。	比 LangGraph 結構簡單，但可能在流程控制、狀態 persistence、複雜分支邏輯上不如 LangGraph 彈性。
CrewAI	多 agent 協作、角色分工、協作流程強；在某些評測中性能／token 使用上也不錯。 :contentReference[oaicite:6]{index=6}	要做多 agent 分工、agent 間溝通協調的應用。	LangGraph 在單 agent 複雜流程上彈性高；CrewAI 在協作與分布式角色上可能更佳。
Smolagents	設計簡潔、code-centric，適合小型任務／輕量流程。 :contentReference[oaicite:7]{index=7}	輕量任務、自動化腳本、小範圍 agent。	LangGraph 更適合複雜流程與可觀察性較強的應用；Smolagents 更快上手但功能可能比較精簡。
Google ADK	企業級、工具與 GCP 生態整合強，有許多內建功能與安全 / 部署／監控的支持。 :contentReference[oaicite:8]{index=8}	大型專案或在 Google Cloud 裡面運作／需要嚴格合規與擴展性。	LangGraph 在雲供應商中立性與開源社群支持上較強；ADK 在 Google 生態中可能比較優勢。
AWS Bedrock Agents	托管服務、管理簡單、AWS 生態整合好。適合想快速投入、且在 AWS 上已有基礎設施者。 :contentReference[oaicite:9]{index=9}	想用托管服務、省基礎建設運維成本，又重視 AWS 安全／合規／日誌監控等功能。	自訂性可能比 LangGraph 或 open source 要少；但部署與管理成本可能也比較低。
LlamaIndex / Semantic Kernel / AutoGen 等	在與知識庫／文件／檔案檢索結合上比較強；有些框架對資料源／檔案型資料／向量檢索等支援很好。 :contentReference[oaicite:10]{index=10}	資訊檢索、文件問答、內部知識庫應用、RAG（Retrieval-Augmented Generation）類型任務。	流程 orchestration／複雜 graph 控制或多 agent 協作上，有些框架功能未必完整；LangGraph 在流程彈性與決策控制上通常更強。

四、LangGraph vs 其他框架的比較維度

下面幾個維度可以幫你判斷在某個專案中應該選 LangGraph 或其他框架：

維度	需要考慮什麼	LangGraph 在這個維度的表現
流程複雜性（Workflow Complexity）	是否有很多分支、迴圈、subtasks、fallback、parallel paths？	很適合複雜流程，Graph 模型讓你可以清楚定義流程路徑與條件。
記憶與狀態管理	是否要跨 session／跨互動保存狀態？是否要有長期記憶？	LangGraph 有支援狀態 persistence，也能記憶上下文與歷史互動。
工具呼叫與 API 整合	是否要頻繁呼叫外部工具／API？工具介面是否複雜？	支援工具節點，非常靈活，但你需要自己定義工具與處理 edge case。
開發速度 vs 控制度	想要快速驗證／原型 vs 想要細節控制（錯誤處理、安全、部署等）	LangGraph 控制度高，但上手與設計成本比較高；簡單任務可能會覺得過於繁重。
可觀察性與維運性	需要有 debug / trace /日誌 /性能監控嗎？	表現很好，有 trace/logging 能夠觀察 agent 流在 graph 中如何執行。
部署與伸縮性	是否要大規模部署？雲端／on-premises／多租戶？	LangGraph 支援自部署，也有管理平台選項，適合需要部署到生產的場景。
成本與資源消耗	LLM API 調用、記憶儲存、節點數量、運算資源等成本如何？	使用複雜 graph 與多節點流程可能會增加 token 用量與運算時間；需要設計時優化。

五、設計 AI Agent 框架時要注意的原則

以下是我整理在設計或選擇 agent 框架／agent 流程時應當遵守或確認的原則／關鍵要素：

流程透明性
流程的每一步：哪些節點、條件分支、錯誤 fallback，是怎麼決定的，要容易讀／容易追蹤。
狀態與記憶管理
包括對話與工具呼叫歷史、用戶資料、任務上下文，要有記憶體機制，能跨步驟／跨 session 保存／恢復。
錯誤處理／例外處理
對 timeout、API 失敗、工具返回錯誤、LLM 推理錯誤等情況要有 fallback／重試／人工干預機制。
安全性與 guardrails
防止 agent 做出不應該做的行為（如濫用工具、洩漏敏感資訊、回答不當內容等）。可以透過限制工具、內容審查、角色提示、人工審核節點等方式。
效能與成本可控性
設計時要考慮 token 數、模型調用頻率、延遲、併發、資源使用率，避免過度浪費；必要時做 lazy evaluation、串流、部分流程預先計算或緩存。
易用性與開發者體驗
API 好用／文件清楚／模板或預設模式可用。程式碼風格一致性好，有助於團隊協作。
可觀察性與監控
日誌、trace、儀表板，讓你可以看出 agent 在哪些節點花了時間、哪裡出錯、工具呼叫狀態、memory 使用情況等。
擴展性／可維護性
框架應該讓你容易擴充工具、擴充分支、加入新模型、變更流程，而不需要把整個架構重寫。
部署與可靠性
包括錯誤恢復、可重啟性、安全部署、資料隱私／安全合規、版本管理等。
符合業務／產品需求
框架不是目的，是工具。先理解業務需求（任務型／聊天型／多 agent／知識型／高可靠／低延遲等），再決定選哪種框架與如何設計流程。

六、總結

LangGraph 是目前 AI Agent 架構中，一個非常強大的選擇，特別是當你的任務流程複雜、有分支與工具／API 呼叫、需要良好記錄與監控、以及要長期維運時。
若任務比較單純（例如單步驟／少工具呼叫／互動性不強），可能選比較輕量或註重易用性的框架會比較快。

七、框架比較速查表

框架	適合程度	優點	欠缺／注意點
LangGraph	多步驟／複雜流程／長期維運	流程控制強、狀態管理好、觀察性佳、工具整合彈性高	建模與設計成本高、上手有門檻、可能資源／延遲／token 使用量較大
OpenAI Agents SDK	原型／快速部署／熟悉 OpenAI 生態者	簡單上手、整合工具呼叫與 function calling、原型速度快	在流程複雜、狀態 persistence、監控與容錯上可能較弱
CrewAI	多 agent 分工協作／agent 間角色互補	協作流程強、可分工、角色設計明確	學習曲線、工具間／agent 間溝通與同步可能複雜
Smolagents	輕量任務、小工具自動化	實現快速、code-centric、簡潔	功能可能比較少，對於流程邊界／錯誤處理／複雜分支支持可能不如 LangGraph